Digital security has been an active area of research interest due to the rapid adaptation of internet infrastructure, the increasing popularity of social media, and digital cameras. Due to inherent differences in working principles to generate an image, different camera brands left behind different intrinsic processing noises which can be used to identify the camera brand. In the last decade, many signal processing and deep learning-based methods have been proposed to identify and isolate this noise from the scene details in an image to detect the source camera brand. One prominent solution is to utilize a hierarchical classification system rather than the traditional single-classifier approach. Different individual networks are used for brand-level and model-level source camera identification. This approach allows for better scaling and requires minimal modifications for adding a new camera brand/model to the solution. However, using different full-fledged networks for both brand and model-level classification substantially increases memory consumption and training complexity. Moreover, extracted low-level features from the different network's initial layers often coincide, resulting in redundant weights. To mitigate the training and memory complexity, we propose a classifier-block-level hierarchical system instead of a network-level one for source camera model classification. Our proposed approach not only results in significantly fewer parameters but also retains the capability to add a new camera model with minimal modification. Thorough experimentation on the publicly available Dresden dataset shows that our proposed approach can achieve the same level of state-of-the-art performance but requires fewer parameters compared to a state-of-the-art network-level hierarchical-based system.
translated by 谷歌翻译
Generating a chain of thought (CoT) can increase large language model (LLM) performance on a wide range of tasks. Zero-shot CoT evaluations, however, have been conducted primarily on logical tasks (e.g. arithmetic, commonsense QA). In this paper, we perform a controlled evaluation of zero-shot CoT across two sensitive domains: harmful questions and stereotype benchmarks. We find that using zero-shot CoT reasoning in a prompt can significantly increase a model's likelihood to produce undesirable output. Without future advances in alignment or explicit mitigation instructions, zero-shot CoT should be avoided on tasks where models can make inferences about marginalized groups or harmful topics.
translated by 谷歌翻译
The availability of Martian atmospheric data provided by several Martian missions broadened the opportunity to investigate and study the conditions of the Martian ionosphere. As such, ionospheric models play a crucial part in improving our understanding of ionospheric behavior in response to different spatial, temporal, and space weather conditions. This work represents an initial attempt to construct an electron density prediction model of the Martian ionosphere using machine learning. The model targets the ionosphere at solar zenith ranging from 70 to 90 degrees, and as such only utilizes observations from the Mars Global Surveyor mission. The performance of different machine learning methods was compared in terms of root mean square error, coefficient of determination, and mean absolute error. The bagged regression trees method performed best out of all the evaluated methods. Furthermore, the optimized bagged regression trees model outperformed other Martian ionosphere models from the literature (MIRI and NeMars) in finding the peak electron density value, and the peak density height in terms of root-mean-square error and mean absolute error.
translated by 谷歌翻译
在多个在线平台上的数量越来越多。尽管这些文章的学术影响得到了广泛的研究,但在线分享的在线兴趣仍不清楚。认识到在线提到的研究文章的时间对研究人员来说可能是有价值的信息。在本文中,我们分析了用户共享和/或讨论学术文章的多个社交媒体平台。我们建立了三个论文集群,根据年度在线提及的出版日期,范围从1920年到2016年。使用这三个群集中的每个集群使用在线社交媒体指标,我们构建了机器学习模型来预测长期的机器学习模型在线对研究文章的兴趣。我们采用两种不同的方法来解决预测任务:回归和分类。对于回归方法,多层感知器模型表现最好,对于分类方法,基于树的模型的性能比其他模型更好。我们发现,在经济和工业的背景下(即专利),旧文章最为明显。相比之下,最近发表的文章在研究平台(即Mendeley)之后是社交媒体平台(即Twitter)最为明显。
translated by 谷歌翻译
当前,根据CNN处理的视频数据,主要执行动作识别。我们研究CNN的表示过程是否也可以通过将基于图像的动作音频表示为任务中的多模式动作识别。为此,我们提出了多模式的音频图像和视频动作识别器(MAIVAR),这是一个基于CNN的音频图像到视频融合模型,以视频和音频方式来实现卓越的动作识别性能。Maivar提取音频的有意义的图像表示,并将其与视频表示形式融合在一起,以获得更好的性能,与大规模动作识别数据集中的两种模式相比。
translated by 谷歌翻译
在过去的十年中,视频通信一直在迅速增加,YouTube提供了一种媒介,用户可以在其中发布,发现,共享和反应视频。引用研究文章的视频数量也有所增加,尤其是因为学术会议需要进行视频提交已变得相对普遍。但是,研究文章与YouTube视频之间的关系尚不清楚,本文的目的是解决此问题。我们使用YouTube视频创建了新的数据集,并在各种在线平台上提到了研究文章。我们发现,视频中引用的大多数文章都与医学和生物化学有关。我们通过统计技术和可视化分析了这些数据集,并建立了机器学习模型,以预测(1)视频中是否引用了研究文章,(2)视频中引用的研究文章是否达到了一定程度的知名度,以及(3)引用研究文章的视频是否流行。最佳模型的F1得分在80%至94%之间。根据我们的结果,在更多推文和新闻报道中提到的研究文章有更高的机会接收视频引用。我们还发现,视频观点对于预测引用和增加研究文章的普及和公众参与科学很重要。
translated by 谷歌翻译
问答(QA)系统越来越多地部署在支持现实世界决策的应用程序中。但是,最新的模型依赖于深层神经网络,这些网络很难被人类解释。固有的可解释模型或事后解释性方法可以帮助用户理解模型如何达到其预测,并在成功的情况下增加对系统的信任。此外,研究人员可以利用这些见解来开发更准确和偏见的新方法。在本文中,我们介绍了Square V2(Square的新版本),以根据图形和基于图形的说明等方法进行比较模型提供解释性基础架构。尽管显着图对于检查每个输入令牌对模型预测的重要性很有用,但来自外部知识图的基于图的解释使用户能够验证模型预测背后的推理。此外,我们提供了多种对抗性攻击,以比较质量检查模型的鲁棒性。通过这些解释性方法和对抗性攻击,我们旨在简化对可信赖的质量检查模型的研究。 Square可在https://square.ukp-lab.de上找到。
translated by 谷歌翻译
自适应实验可以增加当前学生从教学干预的现场实验中获得更好结果的机会。在此类实验中,在收集更多数据时将学生分配到条件变化的可能性,因此可以将学生分配给可能表现更好的干预措施。数字教育环境降低了进行此类适应性实验的障碍,但很少在教育中应用。原因之一可能是研究人员可以访问很少的现实案例研究,这些案例研究说明了在特定情况下这些实验的优势和缺点。我们通过使用Thompson采样算法进行自适应实验来评估学生在学生中提醒的效果,并将其与传统的统一随机实验进行比较。我们将其作为有关如何进行此类实验的案例研究,并提出了有关自适应随机实验可能或多或少有用的条件的一系列开放问题。
translated by 谷歌翻译
由于显微镜图像被广泛用于生物医学或材料研究,因此已使用扫描声显微镜(SAM)。声学成像是无损测试(NDT),生物医学成像和结构健康监测的一种重要且建立的方法。这些成像经常以低振幅的信号进行,这可能导致引导液噪声,缺乏嘈杂的和缺乏的。图像信息的详细信息。在这项工作中,我们试图分析从低振幅信号中获取的SAM图像,并在时间域信号上使用块匹配过滤器以获得DeNocer的图像。我们已经将图像与在时间域信号上应用的常规过滤器进行了比较,例如高斯滤波器,中值滤波器,Wiener滤波器和总变化过滤器。著名的结果在本文中显示。
translated by 谷歌翻译
电离层中存在的电子密度不规则性会引起全球导航卫星系统(GNSS)信号的显着波动。信号功率的波动称为振幅闪烁,可以通过S4指数进行监测。当实时数据不可用时,基于历史S4索引数据的幅度闪烁的严重程度是有益的。在这项工作中,我们研究了使用单个GPS闪烁监测接收器中使用历史数据来训练机器学习(ML)模型的可能性参数。评估了六种不同的ML型号,其中包装的树模型是其中最准确的,使用平衡数据集获得了预测准确性$ 81 \%$,使用不平衡数据集获得了$ 97 \%$ $。
translated by 谷歌翻译